已知现代深度神经网络模型将错误地将分布式(OOD)测试数据分类为具有很高信心的分数(ID)培训课程之一。这可能会对关键安全应用产生灾难性的后果。一种流行的缓解策略是训练单独的分类器,该分类器可以在测试时间检测此类OOD样本。在大多数实际设置中,在火车时间尚不清楚OOD的示例,因此,一个关键问题是:如何使用合成OOD样品来增加ID数据以训练这样的OOD检测器?在本文中,我们为称为CNC的OOD数据增强提出了一种新颖的复合腐败技术。 CNC的主要优点之一是,除了培训集外,它不需要任何固定数据。此外,与当前的最新技术(SOTA)技术不同,CNC不需要在测试时间进行反向传播或结合,从而使我们的方法在推断时更快。我们与过去4年中主要会议的20种方法进行了广泛的比较,表明,在OOD检测准确性和推理时间方面,使用基于CNC的数据增强训练的模型都胜过SOTA。我们包括详细的事后分析,以研究我们方法成功的原因,并确定CNC样本的较高相对熵和多样性是可能的原因。我们还通过对二维数据集进行零件分解分析提供理论见解,以揭示(视觉和定量),我们的方法导致ID类别周围的边界更紧密,从而更好地检测了OOD样品。源代码链接:https://github.com/cnc-ood
translated by 谷歌翻译
车辆路由问题是文献中众所周知的NP-HARD组合优化问题。传统的解决方案方法涉及精心设计的启发式方法或耗时的元启发术。强化学习的最新工作一直是一种有希望的替代方法,但发现在解决方案质量方面很难与传统方法竞争。本文提出了一种混合方法,结合了加强学习,政策推出和可满足性的求解器,以实现计算时间和解决方案质量之间的可调整权衡。在流行的公共数据集中的结果表明,该算法能够比现有基于学习的方法更接近最佳水平,而计算时间较短。该方法需要最少的设计工作,并且能够在没有额外培训的情况下解决看不见的任意规模问题。此外,该方法可以推广到其他组合优化问题。
translated by 谷歌翻译
我们描述了一种针对零售电子商务(电子商务)的需求而开发的新型决策问题。在使用物流和零售业商业合作者的同时,我们发现,从供应链中最适合的产品(称为成本为服务或CTS)的产品提供的产品成本是一个关键挑战。电子商务供应链的大规模,高性计,大大地理传播,使这一设置成为精心设计的数据驱动决策算法。在这项初步工作中,我们专注于在每次仓库中从任何仓库到多个客户提供多个产品的特定子问题。我们比较几个基线的相对性能和计算效率,包括启发式和混合整数线性规划。我们表明,基于加强学习的算法与这些政策具有竞争力,具有现实世界中有效扩大的潜力。
translated by 谷歌翻译